花費 30 ms
Apache Spark源碼走讀之1 -- Spark論文閱讀筆記

歡迎轉載,轉載請注明出處,徽滬一郎。 楔子 源碼閱讀是一件非常容易的事,也是一件非常難的事。容易的是代碼就在那里,一打開就可以看到。難的是要通過代碼明白作者當初為什么要這樣設計,設計之初要解決的主 ...

Tue Apr 15 19:36:00 CST 2014 6 23402
Apache Spark源碼走讀之2 -- Job的提交與運行

歡迎轉載,轉載請注明出處,徽滬一郎。 概要 本文以wordCount為例,詳細說明spark創建和運行job的過程,重點是在進程及線程的創建。 實驗環境搭建 在進行后續操作前,確保下列條件已滿 ...

Tue Apr 22 01:33:00 CST 2014 1 14705
Apache Spark源碼走讀之18 -- 使用Intellij idea調試Spark源碼

歡迎轉載,轉載請注明出處,徽滬一郎。 概要 上篇博文講述了如何通過修改源碼來查看調用堆棧,盡管也很實用,但每修改一次都需要編譯,花費的時間不少,效率不高,而且屬於侵入性的修改,不優雅。本篇講述如何 ...

Thu Jul 17 21:47:00 CST 2014 4 10048
Apache Spark源碼走讀之3 -- Task運行期之函數調用關系分析

歡迎轉載,轉載請注明出處,徽滬一郎。 概要 本篇主要闡述在TaskRunner中執行的task其業務邏輯是如何被調用到的,另外試圖講清楚運行着的task其輸入的數據從哪獲取,處理的結果返回到哪里, ...

Wed Apr 23 23:07:00 CST 2014 0 11013
Apache Spark技術實戰之1 -- KafkaWordCount

歡迎轉載,轉載請注明出處,徽滬一郎。 概要 Spark應用開發實踐性非常強,很多時候可能都會將時間花費在環境的搭建和運行上,如果有一個比較好的指導將會大大的縮短應用開發流程。Spark Strea ...

Sun Aug 03 05:57:00 CST 2014 3 9536
Spark結構式流編程指南

Spark結構式流編程指南 概覽 Structured Streaming 是一個可拓展,容錯的,基於Spark SQL執行引擎的流處理引擎。使用小量的靜態數據模擬流處理。伴隨流數據的到來,Spa ...

Tue Mar 21 01:13:00 CST 2017 0 5409
Apache Spark源碼走讀之11 -- sql的解析與執行

歡迎轉載,轉載請注明出處,徽滬一郎。 概要 在即將發布的spark 1.0中有一個新增的功能,即對sql的支持,也就是說可以用sql來對數據進行查詢,這對於DBA來說無疑是一大福音,因為以前的知識 ...

Wed May 28 00:10:00 CST 2014 1 7641
Spark源碼分析 – SparkContext

Spark源碼分析之-scheduler模塊 這位寫的非常好, 讓我對Spark的源碼分析, 變的輕松了許多 這里自己再梳理一遍 先看一個簡單的spark操作, 1. Spar ...

Wed Dec 25 02:03:00 CST 2013 2 7913
emacs+ensime+sbt打造spark源碼閱讀環境

歡迎轉載,轉載請注明出處,徽滬一郎. 概述 Scala越來越流行, Spark也愈來愈紅火, 對spark的代碼進行走讀也成了一個很普遍的行為。不巧的是,當前java社區中很流行的ide如ecli ...

Sat Apr 12 00:49:00 CST 2014 2 6846

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM